1
Ultrapassando o Teto Sequencial
AI032Lesson 10
00:00

O Fim do 'Almoço Grátis'

Durante décadas, desenvolvedores aproveitaram o "Teto Sequencial" — uma era em que Escalabilidade de Dennard garantia de que cada nova geração de chips trazia velocidades mais rápidas de relógio. Mas atingimos a Parede de Potência. O desempenho já não é uma função da frequência; é uma função da concorrência. Para avançar, devemos empregar Pensamento Computacional para pontuar a lacuna entre os métodos numéricos e os modelos modernos de execução paralela.

A Tensão entre Precisão e Desempenho

Mover um problema de domínio (como Dinâmica Molecular) de um host multicore para dispositivos CUDA é mais do que uma mudança de sintaxe; é uma mudança na Decomposição de Problemas. Quando paralelizamos, muitas vezes mudamos a ordem das operações. Como a aritmética de ponto flutuante é não associativa, enfrentamos um compromisso: Precisão de ponto flutuante versus precisão. Um resultado paralelo pode ser matematicamente válido, mas numericamente divergente do seu ancestral sequencial.

TECHO SEQUENCIALLimite de Velocidade do RelógioAUTOESTRADA PARALELACapacidade de Trabalho do CUDAPONTE DO PENSAMENTO COMPUTACIONAL
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>